三进志
灰色
黑体
0003 一个汉字对应24位二进制数
作者:三进志 浏览:178 评论:0 日期:2021-12-21

一个汉字为什么选择用24位二进制数进行编码?
理由如下:

1. 因为常用的汉字有99%在4000个以内,
而2的12次方是4096,
所以用12位二进制数就可以表示4000个常用字了,
我们在输入汉字的时候希望用最少的按键就能输入一个汉字,
如果按一次键就可以输入一个字,
这速度是最快的,
但要输入4000个不重复的字就需要4000个按键,
这不现实,
此方案行不通。
如果按两次键就可以输入一个字,
这速度是第二快的也不错,
如果要输入4000个不重复的字最少需要多少个按键呢?
因为12位二进制数可以表示4000个字,
如果一个按键对应6位二进制数的话,
那两个按键合起来就是12位二进制数了,
正好,
各不相同的6位二进制数最多有64种,
因此只要有64个按键,
一个按键对应一个唯一的6位二进制数,
就可以实现按两次键就输入一个字了,
这也决定了输入的键盘至少是64键的键盘。

2. 据说完成后的“中华字库”,
预计可编码字符数在50万左右(汉字古文字约10万、
楷书汉字约30万、
各少数民族文字约10万),
这样的话,
就需要20位二进制数来表示,
但我选择用24位二进制数来表示,
原因是因为我已经选用64键键盘了,
而64键键盘的一键是6位二进制数,
要表示不重复的53万字,
至少要20位二进制数,
在64键键盘上就需要敲击四下才能打出一个字来,
这样敲四下就有24位二进制数了,
比最少需要的20位多了四位,
似乎有点浪费,
但因为选择用64键键盘为输入信号源,
只有接受以24位二进制数对应一个汉字了。

24位二进制数可表示16777216个字,
数量比较大,
也利于以后新造汉字的加入。

用6位二进制数作为一个基本单元,
一个汉字用四个基本单元表示。
6位二进制数也叫一卦,
一个汉字用四卦来表示。

0条评论 0/0页
我要评论
目前还没有评论!
评论人:(长度为2到10个字,且不能为敏感词)
电子邮箱:(您的电子邮箱地址不会被公开)
评论内容:(长度为2到1000个字之间)
验证码:(点击验证码输入框,可更换验证码)